#ifndef CPU_KERNEL_H
#define CPU_KERNEL_H

#include "matrix.h"
#include <vector>
#include <string>

// Basic serial matrix multiplication (for reference/validation)
void matrixMultiplySerial(const Matrix& A, const Matrix& B, Matrix& C);

// 高度优化的矩阵乘法实现，自动选择最佳算法
void matrixMultiplyOptimized(const Matrix& A, const Matrix& B, Matrix& C);

#endif // CPU_KERNEL_H 